flowchart TB A(Daten einlesen) --> B(Übersicht verschaffen) --> C(Namen brauchbar machen) --> D(Ergeben die Daten Sinn?) --> E(Skalenwerte berechnen) --> F(multiple lineare Regression) --> G(Ergebnis berichten)
Auswertung Emprischer Daten
flowchart TB A(Daten einlesen) --> B(Übersicht verschaffen) --> C(Namen brauchbar machen) --> D(Ergeben die Daten Sinn?) --> E(Skalenwerte berechnen) --> F(multiple lineare Regression) --> G(Ergebnis berichten)
Welche Faktoren sagen am besten den Resozialisierungserfolg vorher?
Welche Faktoren haben einen Einfluss auf Prdoduktbewertungen?
Welche “Umstände” beinflussen einen Krankheitsverlauf?
Was sind die besten Prädiktoren für Studienerfolg?
Was sind Indikatoren für Unternehmenserfolg?
…
Werden Menschen aggressiver, wenn …
ae_mult_reg.csv
flowchart TB A(Daten einlesen) --> B(Übersicht verschaffen) --> C(Namen brauchbar machen) --> D(Ergeben die Daten Sinn?) --> E(Skalenwerte berechnen) --> F(multiple lineare Regression) --> G(Ergebnis berichten) style A fill: #009e73
flowchart TB A(Daten einlesen) --> B(Übersicht verschaffen) --> C(Namen brauchbar machen) --> D(Ergeben die Daten Sinn?) --> E(Skalenwerte berechnen) --> F(multiple lineare Regression) --> G(Ergebnis berichten) style B fill: #009e73
| id | age | gen | hexp | relu | mghs |
|---|---|---|---|---|---|
| 1 | 22 | 1 | 15 | 2.1 | 26.91 |
| 2 | 40 | 0 | 8 | 1.8 | 17.85 |
| 3 | 39 | 0 | 10 | 1.9 | 29.37 |
| 4 | 42 | 1 | 10 | 1.1 | 12.01 |
| 5 | 38 | 1 | 7 | 0.7 | 14.31 |
| 6 | 21 | 1 | 3 | 1.1 | 9.67 |
flowchart TB A(Daten einlesen) --> B(Übersicht verschaffen) --> C(Namen brauchbar machen) --> D(Ergeben die Daten Sinn?) --> E(Skalenwerte berechnen) --> F(multiple lineare Regression) --> G(Ergebnis berichten) style C fill: #009e73
flowchart TB A(Daten einlesen) --> B(Übersicht verschaffen) --> C(Namen brauchbar machen) --> D(Ergeben die Daten Sinn?) --> E(Skalenwerte berechnen) --> F(multiple lineare Regression) --> G(Ergebnis berichten) style D fill: #009e73
flowchart TB A(Daten einlesen) --> B(Übersicht verschaffen) --> C(Namen brauchbar machen) --> D(Ergeben die Daten Sinn?) --> E(Skalenwerte berechnen) --> F(multiple lineare Regression) --> G(Ergebnis berichten) style E fill: #009e73
flowchart TB A(Daten einlesen) --> B(Übersicht verschaffen) --> C(Namen brauchbar machen) --> D(Ergeben die Daten Sinn?) --> E(Skalenwerte berechnen) --> F(multiple lineare Regression) --> G(Ergebnis berichten) style F fill: #009e73
Voraussetzungen
Voraussetzungen
Wir berechnen zuerst das Modell und prüfen die Vorrausetzungen im Anschluss
Was haben wir gefunden?
Was haben wir gefunden
Call:
lm(formula = mghs ~ hexp + relu, data = ds)
Residuals:
Min 1Q Median 3Q Max
-12.239 -3.413 -0.077 3.705 10.560
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 12.42357 0.77187 16.095 <2e-16 ***
hexp -0.02665 0.08974 -0.297 0.767
relu 5.40432 0.57024 9.477 <2e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 4.655 on 272 degrees of freedom
Multiple R-squared: 0.2881, Adjusted R-squared: 0.2829
F-statistic: 55.04 on 2 and 272 DF, p-value: < 2.2e-16
Graphisch
Statistisch I - RESET
resettest()-Funktion aus dem lmtest-Package
Statistisch I - RESET
Statistisch 2 - Rainbow-Test
raintest()-Funktion aus dem lmtest-Package
Statistisch 2 - Rainbow-Test
Vorrausetzun scheint verletzt zu sein, was nun?
Graphisch - Histogramm der Residuen
Graphisch - Q-Q Plot
Statistisch - Shapiro-Wilk-Test
Graphisch
Statistisch - Breusch-Pagan-Test
ncvTest()-Funktion aus dem car-Package
Statistisch - Breusch-Pagan-Test
Korrelationsmatrix
| Variable | M | SD | X1 | X2 |
|---|---|---|---|---|
| 1. hexp | 7.59 | 3.52 | ||
| 2. relu | 1.22 | 0.55 | .45** | |
| 3. mghs | 18.81 | 5.50 | .23** | .54** |
Variance inflation factor (VIF)
ncvTest()-Funktion aus dem car-Package
Variance inflation factor (VIF)
Cook’s distance
Leverage
Cook’s distance
mit der check_model()-Funktion aus dem performance-Package
flowchart TB A(Daten einlesen) --> B(Übersicht verschaffen) --> C(Namen brauchbar machen) --> D(Ergeben die Daten Sinn?) --> E(Skalenwerte berechnen) --> F(multiple lineare Regression) --> G(Ergebnis berichten) style G fill: #009e73
Parameter |
Fit |
b |
95% CI (b) |
t |
df |
p |
b* |
95% CI (b*) |
|---|---|---|---|---|---|---|---|---|
(Intercept) |
12.42 |
[10.90, 13.94] |
16.10 |
272 |
< .001*** |
0.00 |
[-0.10, 0.10] |
|
hexp |
-0.03 |
[-0.20, 0.15] |
-0.30 |
272 |
.767 |
-0.02 |
[-0.13, 0.10] |
|
relu |
5.40 |
[4.28, 6.53] |
9.48 |
272 |
< .001*** |
0.54 |
[0.43, 0.66] |
|
AIC |
1,631.27 |
|||||||
AICc |
1,631.42 |
|||||||
BIC |
1,645.74 |
|||||||
R2 |
0.29 |
|||||||
R2 (adj.) |
0.28 |
|||||||
Sigma |
4.66 |
flowchart TB A(Daten einlesen) --> B(Übersicht verschaffen) --> C(Namen brauchbar machen) --> D(Ergeben die Daten Sinn?) --> E(Skalenwerte berechnen) --> F(multiple lineare Regression) --> G(Ergebnis berichten) style G fill: #009e73
Zentrierung der Prädiktoren
Zentrierung der Prädiktoren
Was haben wir gefunden?
Graphisch
Statistisch - Rainbow-Test
Graphisch - Q-Q Plot
Statistisch - Shapiro-Wilk-Test
Graphisch
Statistisch - Breusch-Pagan-Test
Variance inflation factor (VIF)
Cook’s distance
JOHNSON-NEYMAN INTERVAL
When relu_cen is OUTSIDE the interval [-0.20, 0.08], the slope of hexp_cen
is p < .05.
Note: The range of observed values of relu_cen is [-1.22, 1.78]
SIMPLE SLOPES ANALYSIS
Slope of hexp_cen when relu_cen = -5.536211e-01 (- 1 SD):
Est. S.E. t val. p
------- ------ -------- ------
-0.58 0.11 -5.47 0.00
Slope of hexp_cen when relu_cen = -2.014550e-16 (Mean):
Est. S.E. t val. p
------ ------ -------- ------
0.07 0.08 0.89 0.37
Slope of hexp_cen when relu_cen = 5.536211e-01 (+ 1 SD):
Est. S.E. t val. p
------ ------ -------- ------
0.72 0.12 5.89 0.00
Graphisch
Graphisch
flowchart TB A(Daten einlesen) --> B(Übersicht verschaffen) --> C(Namen brauchbar machen) --> D(Ergeben die Daten Sinn?) --> E(Skalenwerte berechnen) --> F(multiple lineare Regression) --> G(Ergebnis berichten) style G fill: #009e73
Parameter |
Fit |
b |
95% CI (b) |
t |
df |
p |
b* |
95% CI (b*) |
|---|---|---|---|---|---|---|---|---|
(Intercept) |
12.42 |
[10.90, 13.94] |
16.10 |
272 |
< .001*** |
0.00 |
[-0.10, 0.10] |
|
hexp |
-0.03 |
[-0.20, 0.15] |
-0.30 |
272 |
.767 |
-0.02 |
[-0.13, 0.10] |
|
relu |
5.40 |
[4.28, 6.53] |
9.48 |
272 |
< .001*** |
0.54 |
[0.43, 0.66] |
|
AIC |
1,631.27 |
|||||||
AICc |
1,631.42 |
|||||||
BIC |
1,645.74 |
|||||||
R2 |
0.29 |
|||||||
R2 (adj.) |
0.28 |
|||||||
Sigma |
4.66 |